登录或注册
登录或注册
智能论文笔记
www.aixpaper.com
搜索
最新
推荐
我的收藏
RuDSI: graph-based word sense induction dataset for Russian
Anna Aksenova
,
Ekaterina Gavrishina
,
Elisey Rykov
,
Andrey Kutuzov
分类:
自然语言处理
2022-09-28
我们提出了Rudsi,这是俄罗斯语言感官诱导(WSI)的新基准。该数据集是使用单词用法图(WUGS)的手动注释和半自动聚类创建的。与俄罗斯的先前WSI数据集不同,Rudsi完全由数据驱动(基于俄罗斯国家语料库的文本),没有对注释者强加的外部词感官。根据图聚类的参数,可以从原始注释中产生不同的导数数据集。我们报告了几种基线WSI方法在Rudsi上获得的性能,并讨论了改善这些分数的可能性。
translated by 谷歌翻译